喜欢拍马屁的 Claude,已经引起了人类反感
喜欢拍马屁的 Claude,已经引起了人类反感在很多人眼里,Claude 是“地表最强文科生”,原因是写出来的东西最有人味儿。 但很多人不知道的是,Claude 也是最会拍人类马屁的一个 AI。
在很多人眼里,Claude 是“地表最强文科生”,原因是写出来的东西最有人味儿。 但很多人不知道的是,Claude 也是最会拍人类马屁的一个 AI。
智能体在模拟人类合作行为的捐赠者游戏中表现出不同策略,其中Claude 3.5智能体展现出更有效的合作和惩罚搭便车行为的能力,而Gemini 1.5 Flash和GPT-4o则表现得更自私,结果揭示了不同LLM智能体在合作任务中的道德和行为差异,对未来人机协同社会具有重要意义。
国产之光DeepSeek V3竞技场排名新鲜出炉—— 优于o1-mini(总榜第7),获最强开源模型认证(也是唯一闯入前10的开源模型)。
最近,AI编程圈出现了一个新面孔——Windsurf,这又是一款基于 Claude 的 AI 编程助手,一经推出就在开发者社群引起了不小的轰动。作为一名关注AI编程工具的开发者,我也第一时间上车,花费15刀购买了一个月的会员体验。
Transformer——支撑像 OpenAI 的 ChatGPT 和 Anthropic 的 Claude 这样的聊天机器人的基础 AI 技术——正在帮助机器人更快地学习。
在 2024 年底,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了最新的混合专家(MoE)语言模型 DeepSeek-V3-Base。虽然,目前没有放出详细的模型卡,但官方开源了V3的技术文档PDF。
还没等到官宣,Deepseek-v3竟意外曝光了?!
简单才是王道,Anthropic 的智能体开发的“反直觉”法则
给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台? 实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude 3.5 Sonnet的智能体,就会表现出极强的合作意识。 而GPT-4o则是主打一个“自私”,只考虑自己的短期利益。
今天,大模型公司 Anthropic 的一篇 137 页长论文火了!该论文探讨了大语言模型中的「伪对齐」,通过一系列实验发现:Claude 在训练过程中经常假装有不同的观点,而实际上却保持了其原始偏好。